import numpy as np
import sklearn
import pandas as pd
Dry = pd.read_csv("Dry_Bean_Dataset.csv")
#Dry.info()
#Dry.columns = ['Area', 'Perimeter', 'MajorAxisLength', 'MinorAxisLength','AspectRation',
#'Eccentricity', 'ConvexArea', 'EquivDiameter', 'Extent','Solidity', 'roundness',
#'Compactness', 'ShapeFactor1', 'ShapeFactor2','ShapeFactor3', 'ShapeFactor4', 'Class']
print(Dry.head()) #显示表格
print(Dry["Class"].unique()) #显示Class中的不同值
print(Dry["Class"].nunique()) #显示Class中不同值的个数
print(Dry.columns) #显示列名
print(Dry.index) #Dry.index(x[,i[,j]])注释：x—— 查找的对象。返回值：该方法返回查找对象的索引位置，如果没有找到对象则抛出异常。
print(Dry.duplicated().sum()) #检查重复值
print(Dry.isnull().sum()) #检查数据缺失值
print(Dry.describe()) #数据表描述性统计
print(Dry.groupby("Class").mean()) #对Class汇总

import seaborn as sns
import matplotlib.pyplot as plt
print(Dry["Class"].value_counts()) #查看Class里取样情况
sns.jointplot(x='Class', y='count', data = Dry) #给Class画图